package com.myocr.core.Util;

import cn.hutool.core.io.FileUtil;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.BufferedInputStream;
import java.io.IOException;

public class ParseToTextUtil {

    public static void main(String[] args) {
        BufferedInputStream in = FileUtil.getInputStream("D:/图片/Tess4j2.png");
        ITesseract instance = new Tesseract();

        // 如果需要设置 Tesseract 数据文件的路径，可以使用以下代码
         instance.setDatapath("src/main/resources/engine");

        // 如果需要设置语言，可以使用以下代码（例如：英文 "eng"）
         instance.setLanguage("chi_sim+eng");

        try {
            BufferedImage image = ImageIO.read(in);
            String result = instance.doOCR(image);
            System.out.println("OCR Result:");
            System.out.println(result);
        } catch (TesseractException e) {
            System.err.println(e.getMessage());
        } catch (IOException e) {
            System.err.println("Could not read image file: " + e.getMessage());
        }
    }
}
